在文件中讀取表格
此程式碼範例示範如何使用 IronTesseract OCR 引擎從 PDF 文件中提取文字和表格資料。
- 建立
IronTesseractOCR 引擎的一個實例。 - 初始化一個
OcrInput對象,並使用LoadPdf方法載入 PDF 檔案("table.pdf")。 - OCR 引擎使用
ReadDocumentAdvanced方法處理文檔,該方法傳回一個更詳細的OcrResult物件。 - 使用
result.Tables.First()存取文件中找到的第一個表格,並使用CellInfos提取該表格的儲存格資訊。 - 儲存格資料清單(
cellList)現在包含表格的儲存格,包括文字內容和其他詳細資料(例如,儲存格位置、大小)。 - 此方法可用於從 PDF 中提取結構化資料(如表格),允許以程式設計方式存取和處理每個表格單元格中的文字。
準備好開始了嗎?
Nuget 下載 5,585,834 | 版本: 2026.4 剛剛發布

